机器人学习和体型AI的新兴领域触发了对大量数据的需求不断增长。但是,由于昂贵的数据收集过程和严格的安全要求,从目标域收集足够的公正数据仍然是一个挑战。因此,研究人员经常诉诸于易于加速源域(例如仿真和实验室环境)的数据,以进行具有成本效益的数据获取和快速模型迭代。尽管如此,这些来源的环境和实施方案可能与他们的目标行动完全不同,这强调了有效的跨域政策转移方法的需求。在本文中,我们对存在的跨域政策转移方法进行了系统的审查。通过域间隙的细微分类,我们将每个问题设置的总体见解和设计构成。我们还对跨域政策转移概率中使用的关键方法进行了高级讨论。最后,我们总结了超出当前范式的能力的公开挑战,并讨论了该领域的潜在未来方向。
主要关键词
![arxiv:2402.04580v2 [cs.ro] 2024年8月27日PDF文件第1页](/bimg/1/19761f062f2cc8b096bacd281a060fb9973b6a77.webp)
![arxiv:2402.04580v2 [cs.ro] 2024年8月27日PDF文件第2页](/bimg/d/d00c937066b87cc2dc7f60dd9d150285e189223a.webp)
![arxiv:2402.04580v2 [cs.ro] 2024年8月27日PDF文件第3页](/bimg/f/fd66a7d1eb6a02a49b034c55c4d85df141e0d0f2.webp)
![arxiv:2402.04580v2 [cs.ro] 2024年8月27日PDF文件第4页](/bimg/b/be9e11042b5de7ff93d67ddea1729a7e9cc3b856.webp)
![arxiv:2402.04580v2 [cs.ro] 2024年8月27日PDF文件第5页](/bimg/2/211b88901455e3b0a8d10b90367828642a4a8a94.webp)
